package com.atguigu.gmall.realtime.function;

import com.atguigu.gmall.realtime.util.AtguiguUtil;
import org.apache.flink.table.annotation.DataTypeHint;
import org.apache.flink.table.annotation.FunctionHint;
import org.apache.flink.table.functions.TableFunction;
import org.apache.flink.types.Row;

import java.util.Set;

/**
 * @Author lzc
 * @Date 2023/1/6 09:46
 */
// 使用注解给 Row 中的每一列定义列名和类型
// 如果使用的 pojo, 则不需要注解
@FunctionHint(output = @DataTypeHint("row<kw string>"))
public class KWSplit extends TableFunction<Row> {
    // 约定: 返回值  void
    // 函数名: eval
    // 参数列表: 根据实际情况定
    public void  eval(String item){
        // item 分开: 使用 ik 分词器
        // 我是中国人 => [我, 是, 中国, 人]
       Set<String> kws = AtguiguUtil.ikSplit(item);
        for (String kw : kws) {
            collect(Row.of(kw));
        }
    }
    
}
